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基于 Faster R-CNN 的 日 办 物质 抛射 检测 方法 
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昆明 理工 大 学 信息 工程 与 自动 化 学 院 ， 云 南 昆明 650500 ) 
摘 要 : err ate Mass Ejection, CME) 是 一 种 强烈 的 太阳 爆发 现象 ， 


空间 天 气 和 人 类 生活 都 有 着 巨大 的 影响 ， 因 此 CME 检测 对 预报 CME、 Se 
全 有 重要 意义 。 现 有 检测 方法 多 采用 人 为 定义 特征 和 人 为 界定 阀 值 等 方法 检测 CME。 由 于 人 
为 定义 特征 不 能 很 好 表征 CME 且 有 具有 普 适 性 的 阅 值 难于 选择 , 现 有 CME 检测 方法 对 CME 的 检 
测 效果 有 待 提 升 。 本 文 提 出 一 种 基于 Faster R-CNN 的 日 网 抛射 物质 检测 算法 。 该 方法 首先 
结合 CDAW、SEEDS、CACTus 三 个 著名 CME 目录 信息 ， 人 工 标 注 了 包含 9113 A X E 4e 69 d 
据 集 ， 然 后 根据 CME 的 图 像 特征 较 自然 图 像 少 、 目 标尺 寸 与 自然 图 像 有 差异 等 特点 ,在 特征 
提取 和 锚 点 选择 方面 对 Faster R-CNN 进行 了 改进 。 以 2007 年 6 月 的 CME 标注 数据 为 测试 集 ， 
本 文 算法 检测 出 了 22 个 强 CME 事件 中 的 22 个 和 151 个 弱 CME 事件 中 的 138 个 , 且 对 CME 事 
件 的 中 心 角 和 和 角 宽度 等 特征 参数 的 检测 误差 分 别 在 5 度 和 10 度 以 内 。 

关键 词 :日冕 物质 抛射 ;目标 检测 ， 图 像 处 理 


CME 是 一 种 日 冕 物质 从 太阳 日 蝎 层 向 行星 际 空间 抛射 的 强烈 空间 天 气 现象 目 。 由 于 
CME 具有 巨大 的 速度 和 能 量 且 与 背景 太阳 风 在 磁场 、 速 度 、 温 度 上 存在 差异 ， 它 在 行星 际 
空间 传播 时 会 引起 太阳 风 扰 动 ， 严重 时 甚至 引起 磁 暴 等 极端 空间 天 气 。 这 些 会 导致 大 空中 的 
卫星 故障 和 数据 丢失 、 地 面 电 力 系统 崩溃 及 短波 通信 中 断 等 。 为 了 预防 CME 对 人 类 生活 的 
影响 和 伤害 , 实现 对 CME 的 预报 具有 重要 意义 , 而 CME 检测 是 CME 预报 的 重要 基础 和 前 


提 。 


(a) 


图 1 ABR. (a) LASCO C2 Bl; (b) LASCO C2 图 的 差分 图 。 


Fig.1 Coronal image.(a) LASCO C2 image;(b) Running difference image of LASCO C2 image. 
SOHO(Solar and Heliospheric Observatory) 和 STEREO(Solar Terrestrial Relations 
Observatory) LE Jy ARE f KEN A Se ES EUER. 图 1(a) (D) 是 SOHO 提供 的 LASCO 
C2 图 和 差分 图 。CME 目标 在 日 时 图 像 上 表现 为 一 个 明亮 的 、 纹 理 复 杂 的 增 亮 结构 ， 且 尾随 
着 一 人 Per 基于 这 些 图 像 资 料 ， 人 们 提出 了 多 种 检测 方法 来 检测 CME 的 发 
生 频 率 、 和 角度、 速度、 质量、 能 量 等 特征 。 现 有 的 CME 检测 方法 可 以 分 为 传统 检测 方法 和 
AK CME 检测 方法 的 详细 介绍 可 见 参考 文献 [2]。 
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传统 检测 方法 利用 日 冕 图 像 的 灰 度 或 纹理 特征 和 空间 域 图 像 处 理 方法 实现 CME 检测 。 
Berghmans 等 人 BJ 风 开发 的 计算 机 辅助 CME 跟踪 软件 包 ((Computer Aoded CME Tracking 
software package，CACTus) 通 过 霍 夫 变 换 和 图 像 形态 学 等 方法 对 CME 进行 检测 ， 得 到 CME 
事件 的 位 置 、 角 度 及 速度 等 信息 。CACTus 生成 的 CACTus 目录 是 第 一 个 自动 检测 的 CME 
目录 。Olmedo 等 人 B16 提出 的 太阳 爆发 事件 检测 系统 (Solar Eruptive Even Detection System, 
SEEDS) 利 用 日 园 图 像 的 灰 度 信息 检测 CME 的 前 缘 和 后 缘 。 其 生成 的 SEEDS 目录 和 CACTus 
目录 、 协 调 数据 分 析 研讨 会 数据 中 心 (Coordinated Data Analysis Workshop Data Center, CDAW) 
目录 一 起 组 成 CME 的 三 大 参考 目录 。 其 中 ，CDAW 是 人 工 标记 的 目录 。 人 工 检测 CME 费 
时 费力 ， 且 弱 CME 检测 结果 往往 受 人 为 主观 因素 影响 ， 利 用 计算 机 技术 检测 CME 势必 成 
为 趋势 和 发 展 方向 。 但 是 ， 传 统 的 CME 自动 检测 方法 基本 使 用 阔 值 的 方式 判别 CME， 不 
能 较 好 地 判别 CME。 基 于 简单 的 阔 值 分 析 对 CME 判别 存在 以 下 缺陷 : (D) 阔 值 难以 选 定 ; 
(2) 选 定 的 阐 值 难以 兼顾 强 CME #155 CME。 因 此 ， 当 强 CME 检测 效果 好 时 ， 它们 对 特征 不 
明显 的 弱 CME 检测 效果 变 差 ， 且 对 CME 的 角 宽 度 和 中 心 角 等 信息 的 检测 误差 大 。 
基于 学 习 的 检测 方法 的 思路 是 先 使 用 机 器 学 习 方 法 训练 CME 分 类 器 ， 再 使 用 分 类 器 对 
CME 与 背景 信息 进行 分 类 。Zhang 等 人 中 提出 基于 AdaBoost MA BARU ATTA, WaT 
= 法 直接 识别 扇形 区 域 的 CME. 5 Zhang 等 人 不 同 ，Yin 等 人 四 提出 在 极 坐标 下 检测 CME 的 
L 学 习 方法 ， 该 方法 提取 图 像 的 纹理 、 灰 度 和 HOG (Histogram of Oriented Gradient) 等 特征 ， 
训练 多 特征 融合 的 分 类 器 进行 CME 检测 。 然 而 ， 基 于 学 习 的 检测 方法 基本 使 用 人 为 定义 特 
征 进行 CME 建 模 ， 而 CME 的 图 像 特征 复杂 多 变 , 不 同 的 CME 之 间 的 特征 差异 大 ， 这 导致 
D 人 为 定义 特征 对 CME 的 建 模 效果 较 差 。 
LC) Faster R-CNNU?) 是 现 阶段 最 好 的 目标 检测 算法 之 一 。 基 于 深度 学 习 神 经 网 络 ，Faster 
R-CNN 通过 自主 学 习 数 据 集 的 特征 训练 出 一 个 优秀 的 目标 检测 网 络 。Faster R-CNN 在 
PASCAL VOC (Pattern Analysis, Statistical Modeling and Computational Learning) 数据 集 0 
上 检测 结果 的 mAP(mean Average Precision) 3^ 73.2%， 检 测 效果 良好 ， 现 已 被 应 用 到 多 种 
TS 303 5021031, Faster R-CNN 的 特征 提取 网 络 能 对 CME 进行 较 好 建 模 ， 解 决 了 现 有 CME 
检测 方法 存在 的 人 为 定义 特征 无 法 很 好 表达 CME 的 问题 。 另 外 ，Faster R-CNN 使 用 神经 网 
p 络 训练 出 的 分 类 器 比 基 于 学 习 的 方法 的 分 类 器 的 效果 相对 较 好 。 基 于 以 上 原因 ,本 文 提出 一 
= 种 基于 Faster R-CNN 的 日 冕 物质 抛射 检测 方法 。 本 文 的 主要 工作 包括 : (1) 参 考 CDAW、 
= CACTus. SEEDS 等 CME 目录 和 通过 人 工 校 验 标注 数据 集 ， 本 文 标注 了 包含 9113 RA A 
© 像 的 目标 检测 数据 集 ， (2) 针 对 日 坚 图 像 的 特点 改进 Faster R-CNN 模型 ， 使 其 更 适合 CME 
检测 。 


J 


1 深度 学 习 算 法 及 Faster R-CNN 


随 着 机 器 学 习 的 发 展 和 计算 机 硬件 水 平 的 提高 ， 基 于 深度 学 习 的 目标 检测 算法 层 出 不 
穷 。 在 该 类 算法 中 , R-CNN(Region-based Convolutional Neural Networks) 系 列 (Faster R-CNN 
是 其 中 的 突出 代表 )、SSD(Single Shot MultiBox Detector) [4 和 YOLO(You Only Look Once)!!5! 
是 现 有 性 能 比较 突出 的 几 种 算法 。 该 类 算法 按 处 理 流程 主要 分 为 两 类 : 单 步 Cone-state) Ty 
MEEMI (two-state) 检测 算法 。 双 步 检测 算法 分 两 个 步骤 处 理 目标 检测 问题 ， 先 通过 
选择 性 搜索 算法 或 区 域 建议 网 络 选取 一 定数 量 的 候选 框 , 然后 通过 分 类 网 络 和 回归 网 络 确定 
目标 物体 的 类 别 和 位 置 。 由 于 候选 框 选取 阶段 比较 耗 时 ， 双 步 检测 算法 实时 性 略 差 ， 但 精度 
高 。 为 了 提高 目标 检测 的 实时 性 ，Wei Liu 等 和 Joseph Redmon 等 分 别提 出 了 SSD 和 YOLO 
等 单 步 检测 算法 。 这 类 算法 不 需要 候选 框 选取 ， 直 接 从 原 图 产生 目标 的 类 别 和 位 置 ， 实 时 性 
好 , 但 精度 略 逊 于 双 步 检测 算法 。 这 两 类 算法 在 自然 图 像 集 上 的 检测 效果 都 远 超 于 传统 检测 
方法 。 通 过 实验 对 比 , Faster R-CNN 在 日 冕 图 像 等 非 自 然 图 像 的 检测 鲁 棒 性 比 SSD 和 YOLO 
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好 ， 我 们 选择 Faster R-CNN 作为 基础 网 络 搭建 CME 检测 网 络 。 

Faster R-CNN 是 FastR-CNN09 的 改进 算法 。Fast R-CNN 使 用 选择 性 搜索 算法 选取 候选 
框 ， 这 一 步骤 消耗 时 间 长 ， 成 为 该 方法 提高 实时 性 的 瓶颈 。Faster R-CNN 将 选择 性 搜索 算 
法 蔡 换 为 区 域 建 议 网 络 (Region Proposal Network, RPN) ， 提 高 了 候选 框 选取 的 效率 而 检测 
精度 不 受 影响 。Faster R-CNN 的 网 络 模型 如 图 2 所 示 ， 该 网 络 可 分 为 特征 提取 网 络 、 区 域 
建议 网 络 和 分 类 器 三 个 模块 。 


m————————————————— 


位 置 回归 微调 


特征 提取 网 络 j s 


标 区 域 池 化 


全 连接 层 
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位 置 回归 


图 2 Faster R-CNN 模型 框架 医 


Fig.2 Faster R-CNN model framework 

特征 提取 网 络 使 用 卷 积 层 + 激活 层 + 池 化 层 提 取 图 像 的 特征 图 ，Faster R-CNN 使 用 
VGG16 网 络 071 作 为 特征 提取 网 络 。 特 征 图 被 共享 用 于 后 续 的 区 域 建议 网 络 和 分 类 器 。 

区 域 建议 网 络 用 两 个 分 支 处 理 特征 提取 网 络 输出 的 特征 图 ,一 个 分 支 结合 锚 点 选取 可 能 
包含 目标 的 候选 杠 , 另 一 个 分 支 生 成 候选 框 包含 目标 的 概率 。 结合 两 个 分 支 得 到 候选 目标 的 
位 置 和 置信 和 度 。 锚 点 是 RPN 的 精髓 ， 是 基于 特征 图 的 每 个 特征 点 生成 的 一 组 矩形 框 。RPN 
设置 了 九 种 锚 点 ， 由 三 种 尺寸 和 三 种 长 宽 比 组 合 组 成 。 三 种 尺寸 为 64x64，128x128 和 
256x256， 三 种 长 宽 比 为 1: 1, 1: 2 和 2: 1。 特 征 图 上 每 一 个 元 素 都 根据 这 九 种 锚 点 生成 
九 个 候选 枉 。NxN 特征 图 生成 NxNx9 个 候选 框 。 训 练 过 程 中 随机 选择 128 个 正 候选 框 和 
128 个 负 候 选 框 进行 训练 。 

分 类 器 利用 特征 图 和 区 域 建 议 ， 通 过 全 连接 层 与 softmax 函数 计算 每 个 候选 框 的 类 别 ， 
输出 类 别 概率 向 量 ; 同时 利用 边框 回归 反 计 算 获 得 每 个 候选 框 的 位 置 偏 移 量 , 获得 更 加 精确 
的 目标 位 置 。 


2 ”改进 的 Faster R-CNN 框架 


Faster R-CNN 在 自然 图 像 数 据 的 检测 表现 比较 好 ， 但 由 于 日 园 图 像 与 自然 图 像 的 差异 ， 
Faster R-CNN 直接 用 于 日 金 图 像 检 测 的 效果 比较 差 ， 主 要 有 以 下 两 方面 的 原因 : 

a) 本 文 数据 集 所 用 的 日 冕 图 像 的 差分 图 是 灰 度 图 ， 所 含 色 彩 与 纹理 等 特征 不 如 

PASCAL VOC、COCO0S 等 数据 集中 的 自然 图 像 丰 富 。 

b) HÆR FII CME 目标 尺寸 与 自然 图 像 集 的 目标 尺寸 存在 差异 ， 使 用 针对 自然 图 
象 设置 的 原始 锚 点 检测 效果 较 差 。 

基于 上 述 原 因 ， 本 文 根 据 日 铣 图 像 的 特点 在 特征 提取 网 络 和 错 点 参数 方面 改进 了 Faster 
R-CNN。 改 进 的 Faster R-CNN 模型 如 图 3 所 示 。 


C— 
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特征 提取 网 络 改进 


| | 位 置 回归 微调 
er cid | 目标 区 域 洱 化 | 
| | 分 类 分 数 


区 域 建议 


位 置 回归 


锚 点 改进 


图 3 本 文 改 进 的 Faster R-CNN 模型 框架 ，t0 表示 当前 时 刻 ，t-1 表示 前 一 时 刻 ，t-2 表示 前 第 二 时 刻 。 


Fig. 3. Faster R-CNN model framework is improved in this paper, t0 represents the current moment, t-1 represents the previous moment, 


and t-2 represents the penultimate moment. 


2.1 特征 提取 网 络 改进 


在 目标 检测 领域 ，VGG16 网 络 能 提取 目标 的 抽象 语义 特征 。 但 用 于 日 冕 图 像 等 非 自然 
图 像 特征 提取 时 ， 其 存在 着 随 卷 积 深度 的 增长 导致 特征 退化 而 丢失 浅 层 特征 的 问题 。 而 
ResNet10109] 网 络 通过 引入 残 差 网 络 可 解决 随 卷 积 深度 的 增长 导致 特征 退化 的 问题 ， 残 差 网 
络 相对 于 普通 网 络 所 不 同 的 是 引入 了 跳跃 连接 , 可 以 使 上 一 个 残 差 块 的 信息 没有 阻碍 的 流入 
到 下 一 个 残 差 块 ， 提 高 信息 流通 和 保留 浅 层 特 征 ,并 且 也 避免 了 由 于 网 络 过 深 所 引起 的 梯度 
消失 问题 和 退化 问题 。 日 冕 图 像 所 含 信息 量 比 自然 图 像 少 ， 随 着 卷 积 深度 增加 容易 退化 ， 需 
要 保留 浅 层 特征 。 因 此 ， 本 文 算法 选择 ResNet101 网 络 作为 特征 提取 网 络 。 


图 4 相 邻 CME 的 差分 图 及 极 坐 标 差分 图 。 Ca) 2014 年 1 月 1 日 15 时 12 分 的 差分 图 ，(b) 2014 年 1 月 1 日 15 时 24 分 的 差 
分 图 ; Co) a 图 的 极 坐 标 图 ，〈d) b 图 的 极 坐 标 图 。 


Fig. 4 CME running difference image and polar difference image. (a) The running difference image at 15:12 on 1 January 2014;(b) 
Running difference image at 15:24 on 1 January 2014;(c) Polar coordinates of image a;(d) Polar coordinates of image b. 

H RRRA HAE ASI ESE VE, FASO ZI Fe RA IE. B 4 (a) (b) 所 示 为 
2014 4E 1 H 1 H 15 HF 12 4341 2014 4E 1. H 1 H 15 EJ 24 NIM A E 2:4) ET, 
FA A 38/4/75 B ER T8 SP, REDE — ET 200, Je: — ET 220 A SS AB ze, HL PRG 
图 像 的 背景 相似 性 较 高 。 如 图 4(c) (d) 所 示 ， 日 冕 图 像 差 分 图 转化 为 极 坐标 图 后 ， 相 邻 两 幅 
HÆRRI CME 目标 在 水 平方 向 基本 重合 ， 在 垂直 方向 上 ， 后 一 时 刻 的 CME 目标 高 度 稍 
微 变 高 。 由 于 相 邻 时 刻 的 日 冕 图 像 的 CME 目标 的 特征 和 位 置 有 相似 性 ， 相 邻 图 像 的 特征 融 
合 能 加 强 目 标 特征 的 表达 ， 更 好 地 将 CME 目标 与 背景 区 分 开 。 为 了 更 好 利用 日 冕 图 像 的 时 
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间 序 列 相似 性 和 加 强 CME 目标 的 特征 建 模 ， 我 们 检测 某 一 时 刻 日 时 图 像 时 ， 将 当前 时 刻 特 
征 与 前 两 时 刻 的 特征 融合 。 具体 做 法 为 : 三 个 时 刻 的 日 冕 图 像 经 过 同一 个 特征 提取 网 络 生 成 
三 幅 特 征 图 ， 三 幅 特征 图 由 全 连接 层 卷 积 融合 成 一 幅 新 的 特征 图 ， 新 的 特征 图 作为 RPN 和 
分 类 器 的 输入 。 


2.2 修改 锚 点 


K-meansP9 是 基于 距离 的 聚 类 算法 。 它 采用 距离 作为 相似 性 的 评价 指标 ， 即 认为 两 个 对 
象 的 距离 越 近 ， 其 相似 度 就 越 大 。 该 算法 认为 类 簇 是 由 距离 靠近 的 对 象 组 成 的 ， 因此 把 得 到 
紧凑 且 独 立 的 类 簇 作 为 最 终 目 标 。 

Faster R-CNN 中 的 原始 锚 点 是 针对 自然 图 像 设 置 的 ,其 生成 的 矩形 框 面 积 较 大 。 而 CME 
目标 的 面积 较 小 且 长 宽 比 差异 较 大 ， 与 原始 锚 点 不 匹配 。 基 于 本 文 数据 集 ， 本 文 对 CME H 
标的 面积 和 长 宽 比 进行 聚 类 ， 获 得 面积 和 长 宽 比 组 合 。 根 据 k-means 得 到 的 聚 类 结果 ， 本 文 
设置 了 九 种 锚 点 ， 为 尺寸 (16x 1632x 32,128x 128) 和 长 宽 比 〈1:1,1:2,1:4) 的 组 合 。 


3 ”数据 集 标注 


目前 还 没有 关于 深度 学 习 及 目标 检测 的 CME 数据 集 ， 本 文采 用 自制 的 数据 集 。 本 文 从 
SOHO “下 载 2007 年 6 月 至 9 月 、2014 年 1 月 至 4 月 共 8 个 月 时 长 的 LASCO C2 HAAR 
数据 。 LASCO C2 图 像 经 过 图 形 形 态 学 、 帧 间 差 分 、 极 坐标 转化 等 处 理 后 得 到 极 坐 标 差分 图 。 
差分 图 能 更 好 分 辨 出 CME 目标 的 运动 趋势 和 减少 背景 信息 及 噪声 、 冕 流 等 非 CME 信息 的 
影响 。 极 坐标 图 相对 于 原始 日 冕 图 像 更 有 利和 抢 形 框 的 标注 和 检测 。 因 此 ,本文 以 日 冕 图 像 的 
极 坐 标 差分 图 作为 检测 模型 的 输入 。 


(a) 


(b) 


图 5 CME 分类: (a) 强 CME; (b) 39 CME. 
Fig.5 CME classification :(a) the strong CME;(b) the weak CME. 


本 文 的 数据 集 参 考 了 SEEDS, CDAW, CACTus 三 大 目录 的 信息 标注 CME， 并 通过 人 
工 校 验 进行 纠正 微调 。 根 据 CDAW 目录 对 CME 种 类 定义 ， 我 们 将 CME 分 为 强 CME 和 弱 
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CME。 强 CME 是 指 日 晃 层 在 太阳 剧烈 活动 期 间 抛射 出 的 大 
为 : 高 亮 特 征 区 域 下 
于 40 HERO A Ry UA] A, ALL CDAW 


目录 


积 较 大 、 呈 扩张 状 且 扩 张 速 度 较 快 、 亮 度 特征 明显 、 


EW, SHEA BARE 


抛射 角 宽度 一 般 大 


nom uM 
APSR Jes RA E B] A LUPA. FEA RE: 抛射 物质 较 少 、 


明显 、 抛 射 角 宽度 一 般 小 于 30 度 、 一 般 呈 现 为 小 区 域 的 暗 团 


现象 ， 类 似 CDAW 目录 中 种 类 标记 为 弱 或 非常 弱 的 CME。 如 图 5 Hrs. (a). 


图 矩形 框 区 域 分 别 表示 强 CME MI CME， 右 子 图 为 左 子 图 入 

表 1 为 2007 年 6 月 1 日 至 3 
事件 ， 三 大 目录 同时 都 标记 的 CME 事件 有 4 个 。 
它们 之 间 存 在 较 大 差异 且 有 各 自 的 缺陷 。 如 表 1 的 CME XE] 


p= 


日 期 间 三 大 目录 的 CME 标记 
三 大 目录 都 较 好 地 标记 了 CME 事件 ， 但 


日 0 时 6 分 标记 了 这 个 CME 事件 ,但 CACTus 和 SEEDS 没有 标记 。 同 时 


sU SHR FL 
(b) 图 的 左 子 
E 形 框 区 域 的 放大 图 。 
情况 ， 共 标记 了 16 个 CME 


F 1 tas, CDAW 在 2007 年 6 
也 存在 CACTus 


BL SEEDS 标记 了 某 CME 事件 , 而 其 他 两 个 目录 没有 标记 的 情况 。 


示 ， 三 大 目录 都 标记 了 2007 年 6 月 
的 位 置信 息 差 异 较 大 。 


1 日 7 


像 中 CME 目标 的 真实 位 置 有 差异 。 


如 表 1 的 CME 事件 3 所 


时 30 分 时 刻 起 始 的 CME 事件 ， 但 三 大 目录 标记 
有 时 ， 某 一 目录 标记 为 两 个 在 角度 上 相 邻 的 CME 事件 ， 
目录 会 将 它们 标记 为 同一 个 CME 事件 。 另 外 ， 三 大 目录 标记 的 一 些 CME 事件 


而 在 另 一 个 
的 位 置 与 图 


块 的 灰 度 值 比 图 像 平均 灰 度 值 高 于 5 的 像素 , 当 两 个 目标 块 的 边 


# 1 2007 年 6 月 1 日 至 3 日 三 大 目录 的 CME 标记 情况 对 比 
Tab. 1 June 1, 2007 solstice 3 three log CME mark comparison 
CDAW CACTus SEEDS 
CME " 一 — 
e nr TO TÉ ^ auum TOA AAR 
CBE) CBE) CRE) CRED CBE) 
1 2007/6/1 0:06 227 13 = = = e = = 
2 2007/6/1 5:06 248 14 E = =a == 一 
3 2007/6/1 7:30 88 B3 2007/6/1 6:54 91 28 2007/6/1 7:54 84 38 
4 2007/6/1 14:06 228 7 = a 35 = = = 
5 2007/6/1 22:06 288 121 = == = = a == 
6 2007/6/1 23:54 86 75 2007/6/2 0:06 101 32 2007/6/2 0:06 107 21 
7 EX = == 2007/6/2 1:31 272 18 == ee == 
8 2007/6/2 3:54 275 40 == == = E 全 = 
9 2007/6/2 7:06 284 35 = =s = 2007/6/2 5:30 277 12 
10 == = = = E = 2007/6/2 7:30 113 8 
11 2007/6/2 17:30 58 49 2007/6/2 16:54 78 10 2007/6/2 17:54 74 13 
12 2007/6/3 4:30 T1 21 = == es E -= => 
13 2007/6/3 6:54 84 36 == => == — == = 
14 2007/6/3 9:54 86 71 2007/6/3 9:54 83 40 2007/6/3 9:54 81 45 
15 2007/6/3 16:30 249 30 == == = -— == == 
16 = E = = > 2007/6/3 13:32 76 16 
针对 上 述 问 题 ， 我 们 先 利用 三 大 目录 信息 自动 生成 目标 框 ， 再 使 用 lambellmg 工具 进行 
手工 调整 。 自 动 生成 和 人 工 调整 目标 框 的 步骤 : (1) 取 并 集 ， 取 三 大 目录 标记 的 CME 事件 的 
信息 的 并 集 ; (2) 去 重 ， 当 某 个 CME 事件 被 两 个 以 上 的 目录 标记 时 ， 首 先 以 CDAW 的 信息 
为 准 ， 当 CDAW 没有 标记 时 以 SEEDS 的 信息 为 准 ， 确 定 目录 信息 后 将 其 标注 于 日 冕 图 像 ; 
(3) 人 工 检验 ， 当 三 大 目录 出 现 误 检 时 ， 手 工 将 误 检 信息 剔除 ， 当 参考 目录 给 出 的 位 置 偏离 
CME 真实 位 置 较 大 时 ， 进 行 手 工 调整 。 进 行 手 工 调 整 时 ，CME 目标 的 边缘 设置 为 目标 区 域 


缘 距离 小 于 


10 个 像素 点 时 ， 


两 个 目标 块 归 为 同一 个 CME 目标 ， 边 缘 重新 设置 为 两 个 目标 块 合 并 后 的 边缘 ， 最 后 沿边 缘 
标注 CME 的 和 矩形 目标 框 。 如 图 6 (a) 所 示 ， 三 幅 图 像 分 别 表示 2007 Æ 5 H 1 H 12 BI 54 
分 日 冕 图 像 的 CDAW、SEEDS 和 本 文 数 据 集 的 标记 结果 ， 本 文 数 据 集 的 标记 结果 是 参考 
CDAW 目录 信息 为 主 进行 微调 而 产生 的 。 如 图 e (bo 所 示 ， 三 幅 图 像 分 别 表 示 2014 年 2 
H 16 H 18 时 12 4H A FS] SEEDS, CACTus 和 本 文 数据 集 的 标记 结果 ，CDAW 在 该 日 
RAV LIA bid CME, 本 文 数据 集 的 标注 结果 是 参考 SEEDS 目录 的 信息 为 主 进 行 微调 而 
产生 的 。 如 图 6 Cc) 所 示 ， 三 幅 图 像 分 别 表示 CDAW、SEEDS 和 CACTus 的 误 检 情况 : 第 
一 幅 图 为 CDAW 目录 在 2007 年 5 月 2 日 11 时 6 分 日 冕 图 像 上 标注 的 CME 区 域 ， 但 此 区 
域 并 未 存在 CME 目标 ; 第 二 幅 图 像 为 SEEDS 目录 在 2014 4E 2 H 19 A 3 NF 24 PA RAR 
检测 到 的 CME 区 域 ， 但 此 区 域 属于 已 抛射 的 CME 留 下 的 尾部 ， 并 非 一 个 新 的 CME 目标 ; 
第 三 幅 图 像 显示 CACTus 目录 在 2014 年 2 月 19 日 4 时 24 分 的 日 园 图 像 上 检测 到 的 CME 
Dd, 但 该 区 域 并 未 存在 CME 目标 。 在 人 工 校 验 阶 段 ， 这些 被 误 检 的 CME 目标 将 被 剔除 。 


(a) 


(b) 


(c) 


图 6 本 文 数 据 集 标 注 示 意图 。 Ca) 以 CDAW 为 主 的 情况 ;， (b) DL SEEDS KEREN; C) 三 大 目录 误 检 现象 。 红 框 表示 CDAW, 
黄 框 表示 SEEDS， 蓝 框 表示 CACTus， 白 框 表 示 本 文 数据 集 。 


Fig. 6 The annotated schematic diagram of the data set in this paper.(a) In cases where CDAW predominates;(b) In the case of SEEDS;(c) 
Three log errors.The red boxes represent CDAW, the yellow boxes represent Seeds, the blue boxes represent Cactus, and the white boxes 
represent the text dataset. 

基于 上 述 标准 ， 我 们 标记 了 从 SOHO 下 载 的 8 个 月 时 长 的 日 冕 图 像 数据 。 其 共 包含 
19524 幅 图 像 ， 其 中 含有 CME 目标 的 图 像 有 9113 幅 ， 共 标注 了 1537 个 CME 事件 和 13599 
个 标注 框 。 本 文选 取 2007 年 7-9 月 和 2014 年 1-3 月 的 数据 作为 训练 集 ，2014 年 4 月 数据 作 


为 验证 集 ， 而 2007 年 6 


件 和 997 个 弱 CME 事件 ， 


事件 ， 测 试 集 包含 有 875 | 


Dan 
[Er 


H 


4 ”实验 训练 与 结果 验证 


数据 作为 测试 集 。 
E 集 包含 有 1983 幅 
图 像 、22 个 强 


本 文 模 型 在 


在 ImageNet 训练 参数 的 基础 上 ， 采 月 


HAS SC 


训练 


集 包含 有 


图 


主 频 2.6GHZ、 内 存 16.00Gb、 搭 载 GTX1070 显卡 


6255 幅 图 像 、 


的 联想 1 


128 个 强 CME 事 
像 、44 个 强 CME 事件 和 195 个 弱 CME 
i CME 事件 和 151 个 弱 CME 事件 。 


电脑 上 训练 完成 。 
自制 数据 集 对 本 文 网 络 进行 Finetune 训练 。 初 始 


E>) E EA 0.001, (RB) 35000 次 时 ， 学 习 率 减 小 到 0.0001， 最 大 迭代 次 数 为 70000。 


AT 


F 价 检测 模型 


! 的 检测 效果 ， 本 文采 用 召回 率 、 


间 标 都 是 强 CME 和 弱 CME 两 个 类 别 的 平均 值 。 


4.1 验证 Faster R-CNN 改进 的 有 效 性 


为 了 验证 我 们 对 Faster R-CNN 的 改进 的 有 效 性 ， 本 文 
Faster R-CNN、 Faster R-CNN+ResNet101、Faster R-CNN+ 三 个 时 刻 特征 
合 所 有 改进 的 本 文 模型 。 石 


锚 点 改进 和 集 


uo 


准确 


E 本 文 数据 集 的 验证 


表 2 模型 改进 的 实验 结果 


Tab. 2 Experimental results of model improvement 


KAI mAP 等 指标 进行 评估 。 这 三 个 


设置 了 五 组 对 比 实 验 ， 分 别 为 
融合 、Faster R-CNN+ 
集 上 的 实验 结果 如 表 2 所 示 。 


模型 召回 率 准确 率 mAP 

Faster R-CNN 0.651 0.556 0.591 

Faster R-CNN+ResNet101 0.699 0.718 0.706 

Faster R-CNN+ 三 个 时 刻 特征 融合 0.712 0.688 0.694 

Faster R-CNN+ 锚 点 改进 0.792 0.733 0.771 

本 文 模型 0.873 0.753 0.815 
首先 ， 分 析 不 同 改进 对 召回 率 的 影响 。 每 一 种 改进 都 在 召回 率 上 有 所 提升 ， 锚 点 改进 对 
召回 率 提升 效果 最 好 ，ResNet101 网 络 的 提升 较 小 。 这 是 因为 改进 的 锚 点 更 匹配 CME 目标 
的 面积 和 长 宽 比 。 在 准确 率 指标 上 ， 改 进 的 锚 点 一 样 取得 最 好 的 提升 效果 ， 其 他 两 种 改进 取 
得 的 提升 效果 也 较 明 显 。 最 后 ， 由 于 ResNet101 保留 了 日 冕 图 像 的 浅 层 特 征 ， 三 个 时 刻 特 征 
融合 更 是 利用 日 冕 图 像 的 时 间 相 关 性 加 强 了 当前 时 刻 的 CME 特征 ， 三 种 改进 在 mAP 指标 

上 都 提升 10% 以 上 ， 提 升 效 果 比 较 明 显 。 


B, E 合 了 三 


率 提 升 22.2%、; 


4 In 


EAR GEFT 19.796. 


点 对 Faster R-CNN 的 改进 是 有 效 的 。 


4.2 不 同 目标 检测 算法 对 比 


为 了 验证 本 文 模型 
YOLO V3PH 等 


JH] CME 检测 效果 ， 本 文 分 别 月 


I 改 进 的 本 文 模型 在 各 个 指标 上 都 比 pu R-CNN 有 所 提升 ， 
mAP 提升 22.4%。 


四 类 检测 模型 对 本 文 数据 集 


S 的 验证 


HAS SC 模型、 
集 进 行 测试 。 实 验 结果 如 表 3 所 示 。 


这 表明 了 本 文 基于 日 


J 


Faster R-CNN 、 


其 中 ， 
冕 图 像 的 特 


SSD 和 
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表 3 四 类 检测 模型 的 实验 结果 


Tab. 3 Experimental results of four kinds of detection models 


模型 召回 率 准确 率 mAP 
Faster R-CNN 0.701 0.557 0.594 
SSD 0.671 0.473 0.522 
YOLO V3 0.645 0.438 0.504 
本 文 模型 0.873 0.753 0.815 


SSD 和 YOLO V3 等 一 步 检 测算 法 由 于 仅 提 取 图 像 的 深层 特征 、 缺少 第 二 次 边框 回归 等 


原因 ， 在 CME 检测 上 表现 较 差 。Faster R-CNN 也 存在 一 步 检测 算法 的 缺点 ， 但 由 于 其 是 两 
步 回 归 ， 能 通过 第 二 步 回 归 提 高 检测 效果 ， 具 有 更 强 的 鲁 棒 性 和 检测 效果 。Faster R-CNN 
的 检测 效果 比 SSD、YOLO V3 略 好 ， 但 比 本 文 算法 检测 效果 差 。 本 文 模型 拥有 最 好 的 检测 
表现 ，mAP 为 81.596. 


4.3 与 传统 CME 目录 对 比 


如 图 7 所 示 , 一 个 CME 事件 在 极 坐标 图 上 表现 为 一 系列 水 平方 向 上 有 重合 ， 垂 直方 向 
上 逐渐 升 高 的 具有 明亮 特征 的 CME 目标 。 从 另 一 方面 说 , 就 是 当前 时 刻 日 冕 图 像 中 的 CME 
目标 与 前 一 时 刻 图 像 中 的 某 个 CME 目标 在 水 平方 向 上 重合 且 在 垂直 方向 上 升 高 时 ， 这 两 个 
目标 就 属于 同一 CME 事件 。 利 用 这 个 特征 ， 我 们 在 本 文 模型 检测 出 的 结果 数据 上 定义 了 
CME 事件 的 认证 标准 : 相 邻 时 刻 图 像 上 的 两 个 目标 框 在 水 平方 向 上 重 登 率 超过 50% 并 且 在 
垂直 方向 上 随时 间 升 高 ， 即 可 认定 这 两 个 目标 框 属于 同一 个 CME 事件 ， 重 车 率 为 两 个 目标 
框 在 水 平方 向 的 重 车 宽度 除 于 宽度 较 小 的 目标 框 的 水 平 宽度 。 根据 认证 标准 , 我 们 确定 一 个 
CME 事件 所 包含 的 多 个 CME 目标 框 。 如 果 这 些 目标 框 超 三 分 之 二 为 弱 CME 目标 ， 则 该 
CME 事件 为 弱 CME， 反 之 ， 认 为 其 为 强 CME。 角 宽度 为 该 CME 事件 的 多 个 目标 框 的 右边 
界 的 最 大 值 与 左边 界 的 最 小 值 之 差 ; 中 心 角 为 该 CME 事件 的 多 个 目标 框 的 左边 界 的 最 小 值 
加 上 和 角 宽 度 的 三 分 之 一 。 根 据 定义 ， 我 们 遍历 本 文 模型 的 检测 结果 生成 本 文 的 CME 目录 。 
本 文 2007 年 6 月 的 CME 目录 被 发 布 于 https://gitee.com/xian-xianggui/faster-renn-cme o 


o 9$ 100 10 20 20 30 90 0 8 Wo 150 X 
太阳 偏 角 / 度 太阳 偏 角 / 度 


(a) (c) 


20 30 350 0 50 w 150 mx 20 3X0 3 
太阳 信和 角 / 度 


202105.00015v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


(d) (e) (f) 
7 2007 年 6 月 9 日 16 时 54 分 起 始 的 弱 CME 事件 前 三 帧 的 检测 效果 ， 红 框 为 CDAW 检测 结果 ， 黄 框 为 SEEDS 检测 结果 ， 白 框 
为 本 文 数据 集 标注 结果 ，CACTus 没有 检测 到 此 事件 。 (a) - Ce) 为 16 时 54 分 、17 时 06 分 、17 时 30 分 的 极 坐标 差分 图 ，(e) 
- C) W (a) -(c) 对 应 的 日 冕 图 像 差 分 图 。 


Fig.7 For the detection effect of the first three frames of weak CME event starting at 16:54 on June 9, 2007, the red box is the test result 


of CDAW, the yellow box is the test result of SEEDS, and the white box is the annotation result of the data set in this paper. Cactus did 
not detect this event.(a) - (c) is the polar coordinate running difference diagram at 16:54, 17:06 and 17:30;(e) - (f) is the running 
difference diagram of coronal image corresponding to (a) - (c). 

目前 ， 学 术 界 对 CME 事件 的 定义 并 不 明确 ， 在 CME 检测 的 正确 率 方面 也 没有 公开 的 
评价 标准 。 本 文 标注 的 数据 集 参 考 了 现 有 的 CDAW、CACTus、SEEDS 等 三 大 CME 目录 ， 
综合 了 它们 的 优点 ， 并 通过 人 工 校 验 进行 人 工 调 整 ， 具 有 一 定 的 准确 性 和 全 面 性 。 以 我 们 自 
制 的 数据 集 为 参照 标准 ， 我 们 对 比 了 本 文 目 录 与 现 有 三 大 目录 的 检测 效果 。 以 2007 年 6 月 
的 数据 集 作为 测试 集 ， 本 文 从 两 个 方面 对 CME 检测 效果 进行 评估 : CME 事件 数量 的 检测 
和 CME 事件 参数 的 检测 。 


4.3.1 CME 正确 检测 数量 


在 CME 事件 数量 检测 方面 。 强 CME 是 活动 比较 激烈 的 太阳 活动 ， 对 太空 天 气 和 人 类 
生活 的 影响 大 ， 因 此 能 正确 检测 出 强 CME 非常 重要 。 本 文 首 先 在 强 CME 正确 检测 数量 上 
与 现 有 三 大 目录 比较 。 另 外 ， 现 有 的 检测 方法 在 弱 CME 检测 上 表现 均 不 如 强 CME。 因 此 ， 
提高 对 弱 CME 的 检测 正确 率 也 是 CME 检测 方法 改进 的 重要 目的 。 

由 于 CME 定义 与 背景 蝎 流 的 影响 ,CDAW 等 人 工 标记 目录 和 自动 检测 的 目录 得 到 同一 
个 CME 事件 的 特征 参数 有 差异 。 虽 然 不 同 目录 得 到 同一 个 CME 事件 的 参数 有 一 定 偏差 ， 
但 从 相关 性 上 可 确定 为 同一 CME 事件 本文 定义 检测 正确 的 CME 事件 为 : 目录 标记 的 CME 
事件 在 水 平方 向 上 的 角度 与 数据 集 标 注 的 CME 事件 的 角度 重 有 登 率 大 于 50%, H CME 事件 
的 起 始 时 刻 与 数据 集 CME 事件 的 起 始 时 刻 相差 在 1.5 个 小 时 以 内 ， 则 目录 标记 的 该 CME 
事件 被 认定 为 一 个 检测 正确 的 CME 事件 。 如 图 7 所 示 为 检测 正确 的 CME: CDAW 检测 到 
的 CME 位 置 与 数据 集 的 重 登 率 为 100%， 且 起 始 时 间 与 数据 集 标注 的 起 始 时 间 一 样 都 是 在 
16 时 54 分 ， 即 CDAW 的 检测 结果 是 正确 的 ，SEEDS 检测 到 的 CME 位 置 与 数据 集 的 重 肢 
率 为 100%， 且 起 始 时 间 与 数据 集 标注 的 起 始 时 间 相 差 12 分 钟 ， 即 SEEDS 的 检测 检测 结果 
也 是 正确 的 。 


不 同 目录 的 CME 数 量 对 比 
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图 8 各 个 目录 的 正确 CME 数量 的 对 比 图 
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Fig. 8 A comparison of the correct number of CME entries for each log 


各 个 目录 的 正确 CME 数量 的 对 比 结果 如 图 8 所 示 。 我 们 使 用 的 2007 年 06 月 的 测试 集 
共 标 记 了 22 个 强 CME 和 151 个 弱 CME。 强 CME 检测 方面 ，CDAW、SEEDS、CACTus 
分 别 检测 出 22 个 、11 个 和 9 个 。 弱 CME 检测 方面 ，CDAW、SEEDS、CACTus 分 别 检测 
出 127 个 、15 个 和 11 个 。 而 本 文 算法 检测 出 了 22 个 强 CME 和 138 个 弱 CME. KE, Æ 
强 CME 和 弱 CME 检测 上 ， 本 文 算法 都 取得 最 好 的 效果 。 这 是 因为 在 标注 数据 集 时 我 们 综 
合 了 三 个 目录 的 信息 , 标注 一 些 在 CDAW KAN, 但 可 以 在 SEEDS 或 CACTus 目录 找到 的 
CME. WE 9 所 示 ，(a) 图 为 本 文 方法 和 其 他 CME 目录 对 强 CME 的 检测 效果 ; (b) 图 为 本 文 
方法 和 其 他 CME 目录 对 弱 CME 的 检测 效果 。 


(a) 


amana i B pu es den MURUS audi Di RETE 
图 9 本 文 方法 检测 效果 ， Ca) 强 CME 检测 效果 Cb) 959 CME 的 检测 效果 。 红 框 表示 CDAW, 黄 框 表示 SEEDS， 蓝 框 表示 CACTus， 
白 框 表示 本 文 检测 结果 。 


Fig. 9 The detection effect of this method is (a) strong CME detection effect;(b) Weak CME detection effect.Red boxes represent CDAW, 


yellow boxes represent SEEDS, blue boxes represent Cactus, and white boxes represent article logs. 
4.3.2 CME 特征 参数 


CME 特征 参数 检测 的 准确 性 是 评价 CME 检测 算法 的 重要 部 分 。 本 文 将 以 2007 年 06 
月 测试 集 为 基准 ,对比 本 文 算 法 与 其 他 三 个 目录 在 CME 的 中 心 角 和 角 宽 度 的 检测 上 的 表现 。 
CME 事件 在 极 坐标 图 上 表现 为 一 系列 水 平方 向 上 有 重合 ， 垂 直方 向 上 逐渐 升 高 的 具有 明亮 
特征 的 CME 目标 。 本 文 取 测试 集 CME 事件 标注 的 多 个 CME 目标 的 最 小 左边 缘 作为 整个 
CME 事件 的 左边 缘 ， 多 个 CME 目标 的 最 大 右边 缘 作 为 整个 CME 事件 的 右边 缘 ， 左 右边 缘 
4 宽度 即 为 CME 事件 的 角 宽 度 ， 中 心 点 的 角度 即 为 中 心 角 。 由 此 ， 本 文 得 到 测试 集 的 各 
CME 事件 的 中 心 角 和 和 角 宽度 的 参数 。 检 测 结 果 显 示 ， 本 文 算法 与 三 大 目录 同时 都 标记 到 的 
强 CME 有 9 个 , 88 CME 有 10 个 。 以 这 19 个 CME 事件 为 对 象 , 参照 测试 集 的 参数 为 标准 ， 
本 文 统计 本 文 目录 和 三 大 目录 各 自 的 相对 于 测试 集 的 中 心 角 和 和 角 宽度 的 平均 误差 。 统 计 结 果 
如 图 10 所 示 。 
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各 个 目录 的 CME 参 数 平均 误差 
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Fig. 10 Average error of CME parameters for each log 


从 图 10 可 以 看 出 ， 本 算法 和 CDAW 目录 在 中 心 角 和 和 角 宽度 上 与 测试 集 相差 不 大 ， 本 
文 目录 的 中 心 角 和 角 宽 度 平 均 误 差分 别 为 3.3 EM 8.2 度 ，CDAW 目录 平均 误差 为 5.6 度 和 
10.4 度 。 而 SEEDS 和 CACTus 目录 由 于 采用 简单 阔 值 的 方法 判别 CME, 它们 的 中 心 角 和 角 
宽度 的 平均 误差 相对 较 大 。 本 文 算法 在 CME 中 心 角 和 角 宽 度 的 检测 方面 都 比 现 有 三 大 目录 
更 精确 。 


5 ”结束 语 


由 于 人 为 定义 CME 特征 和 设 定 CME 分 割 闵 值 ， 现 有 的 CME 检测 方法 难以 很 好 建 模 
CME 及 选取 普 适 性 的 阐 值 ， 存 在 检测 效果 不 好 的 问题 。 因 此 ， 本 文 引入 基于 深度 学 习 的 目 
标 检测 模型 检测 CME。 首 先 ， 参 考 CDAW、CACTus 和 SEEDS 等 目录 标注 CME 数据 集 ， 
利用 自制 数据 集训 练 出 的 特征 提取 网 络 能 够 很 好 提取 CME 特征 信息 。 另 外 ， 深 度 学 习 检测 
模型 自主 训练 分 类 器 ， 避 免 了 人 为 设 定 阔 值 的 缺陷 ,因此 本 文 算 法 对 CME 有 较 好 的 检测 效 
果 。 以 2007 年 6 月 的 测试 集 为 基准 ， 本 文 算法 有 以 下 优势 : 一 、 本 文 算 法 对 强 CME MIY 
CME 的 检测 正确 率 分 别 达到 100% 和 91.4%。 其 中 对 全 部 CME 的 检测 准确 率 为 92.5%， 分 
别 比 CDAW、SEEDS 和 CACTus 高 出 6.4%、72% 和 81%; 二 、 能 够 检测 出 CDAW 目录 漏 
标的 弱 CME FAE, 我们 检测 出 的 CDAW 漏 掉 的 弱 CME 有 一 部 分 是 SEEDS 或 CACTus 标注 的 弱 
CME， 男 一 部 分 根据 我 们 给 出 的 弱 CME 的 定义 可 认证 为 弱 CME; 三 、 在 本 文 标注 的 测试 集 上 ， 
本 文 算法 检测 出 的 CME 中 心 角 和 角 宽 度 等 参数 比 现 有 三 大 目录 更 精确 。 

本 文 工 作 有 以 下 两 个 创新 意义 。 首 先 ， 引 入 深度 学 习 方法 ， 自 主 提 取 CME 特征 ， 能 
好 表达 CME 目标 ， 取 得 了 较 好 的 CME 检测 效果 。 另 外 ， 参 考 CDAW、CACTus、SEEDS 
三 大 目录 的 CME 信息 ， 我 们 标注 了 目标 检测 的 CME 数据 集 。 这 个 数据 集 综合 了 三 大 CME 
目录 的 优势 并 经 过 人 工 校 验 调整 ,能 一 定 程 度 正确 反映 CME 的 发 生 情况 , 也 可 为 后 续 CME 
的 检测 提供 数据 集 上 的 参考 。 虽 然 ， 本 文 对 CME 检测 进行 了 研究 并 取得 了 一 定 的 进展 ， 但 
限于 时 间 和 知识 面 的 关系 ， 后 续 还 可 进行 以 下 改进 : (1) 数 据 集 的 信息 相对 单一 旦 没有 用 到 
CDAW 等 三 大 目录 的 速度 和 加 速度 等 参数 ， 后 续 可 以 加 入 这 些 信 息 。(2) 本 文 算法 没有 测量 
CME 事件 的 速度 等 特征 ， 后 续 可 以 检测 这 些 CME 参数 。 
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Detection algorithm of Coronal Mass Ejections based on 


Faster R-CNN 


Xian Xianggui, Shang Zhenhong, Yuan Meiyu, Yang Zhipeng 
(Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China) 

Abstract: Coronal Mass Ejection (CME) is a strong solar eruption, which has a great impact 
on space weather and human life. Therefore, CME detection is of great significance in predicting 
CME and ensuring the safety of human production and life. The existing detection methods 
mostly use artificial defined features and artificial defined threshold to detect CME. Because 
artificially defined features cannot well represent weak CMEs and it is difficult to select a 
universal threshold, the detection effect of existing CME detection methods for weak CMEs needs 
to be improved. A CME detection algorithm based on Faster R-CNN is proposed in this paper. In 
this method, a dataset containing 9113 coronal images was manually annotated by combining the 
log information of three famous CME catalog, CDAW, SEEDS and CACTus. Then, according to 
the characteristics of CME images with fewer features than natural images and the difference in 
target size from natural images, Faster R-CNN was improved in feature extraction and anchor 
point selection. Using the CME data in June 2007 as the test set, the algorithm detected 22 out of 
22 strong CME events and 138 out of 151 weak CME events, and the detection errors of 
characteristic parameters such as center Angle and Angle width of CME events were within 5 
degrees and 10 degrees, respectively. 
Key words: Coronal Mass Ejection; Target detection; Image processing 


